Proyecto Paraná 2023

Introducción

Este documento funciona como soporte del proyecto Estimar indicadores de calidad de agua en la cuenca media del río paraná para el desarrollo de un algoritmo mediante técnicas de teledetección satelital (MSECRE0008604), desarrollado por el Grupo de Investigación Sobre Temas Ambientales y Químicos (GISTAQ) de la Universidad Tecnológica Nacional Facultad Regional Resistencia.

A continuación se describen el objetivo general (1) y específicos del presente proyecto. Se detallan las tareas que se ejecutan para la obtención, extracción y almacenamiento de datos espectrales y fisicoquímicos (2). Luego, se describe la metodología de los muestreos (3). Los resultados (4) incluyen las relaciones entre parámetros y la evolución de estos. Se visualizan las firmas espectrales por sitio y por muestreo (5). Finalmente, se describen el desarrollo y selección de algoritmos (6).

La finalidad de este desarrollo es reunir en un único sitio web las características principales del proyecto, registrar datos, visualizar resultados y evaluar algoritmos.

En particular, este documento sirve como una guía para entender cómo se obtienen los datos pertinentes al proyecto de investigación, visualizar resultados, evaluar algoritmos y como material de consulta general de la metodología.

1 Objetivo

El objetivo principal del proyecto de investigación es:

Modelar la calidad del agua en una porción de la cuenca media del río Paraná mediante el desarrollo de un algoritmo construido a partir de técnicas estadísticas, información espacial y datos decampo

Los objetivos específicos son:

  • Seleccionar un sector de la cuenca media del río Paraná, en la confluencia delos ríos Paraguay-Paraná, y en la toma de agua de la empresa potabilizadora de la ciudad de Resistencia.

  • Definir la cantidad y ubicación geográfica de los sitios de muestreo considerando el sensor satelital elegido, la logística y las características de la región de interés.

  • Analizar los sólidos suspendidos y la turbidez como indicadores de la calidad del agua en las muestras recolectadas en los sitios previamente seleccionados.

  • Construir una base de datos espaciotemporales a partir de productos satelitales ópticos, en reflectancia de superficie.

  • Calcular índices espectrales relacionados con la cuantificación delos indicadores de calidad del agua.

  • Desarrollar un algoritmo semiempírico que permita estimar indicadores de la calidad del agua a partir delos datos de campo y los datos espectrales de los productos espaciales.

  • Validar el algoritmo desarrollado, evaluar su significancia estadística y compararlo con otros encontrados en referencias bibliográficas.

  • Generar mapas de los parámetros estimados y su evolución temporal a partir de la aplicación del algoritmo obtenido.

  • Analizar espaciotemporalmente el comportamiento de los indicadores de calidad de agua.

  • Formar RRHH en el área específica.

El desarrollo de algoritmos empíricos requiere de datos espectrales y fisicoquímicos del agua, la propuesta de modelos candidatos, la selección final de los modelos y la validación de los mismos. Luego, la generación de mapas para evaluar la distribución espacial de las propiedades.

Se pretende automatizar la descarga, extracción y almacenamiento de los datos espectrales y fisicoquímicos del agua en los sitios de muestreo, junto con las coordenadas geográficas.

A medida que el proyecto avance los resultados parciales serán registrados en el presente sitio web, para su seguimiento y revisión por parte de los integrantes.

2 Ejecución

El proyecto está gestionado mediante targets. Para ejecutar todas las funciones, correr en la consola:

targets::tar_make()

Esto genera una ejecución en cadena de múltiples funciones que permiten la obtención de datos espectrales y fisicoquímicos para la generación y almacenamiento de resultados.

Utilizar targets permite asegurar el orden correcto de ejecución y facilita la resolución de potenciales problemas.

2.1 Funciones

El archivo _targets.R contiene los paquetes necesarios y las funciones a ejecutar, en el orden adecuado y las relaciones entre sí.

Para visualizar las dependencias y el estado actual entre funciones correr:

targets::tar_visnetwork()

A continuación, se describen las funciones objetivo.

2.1.1 excel

El archivo Excel datos/datos_gistaq.xlsx contiene todos los datos del muestreo y los resultados de los análisis fisicoquímicos.

Incluye la fecha, las coordenadas geográficas de los sitios de muestreo, los valores de pH, conductividad (μS/cm), profundidad de disco de Secchi (cm), sólidos suspendidos (mg/L) y turbidez, por dos métodos: colorimétrico (HATCH, NTU) y turbidímetro (Hazemeter, EBC).

Luego de cada muestra de agua (3) es procesada, se actualiza manualmente este archivo con los datos obtenidos. Modificando este archivo, al ejecutar la función vista al inicio de esta sección (2), se suceden todas las funciones.

2.1.2 fecha_descarga

A partir de las fechas ya previamente analizadas, sacadas de la base de datos, se obtiene del archivo Excel, la última fecha faltante.

A partir de esta fecha se procede a la descarga del producto correspondiente.

2.1.3 script_py

Usando la plantilla scripts/plantilla.py de un código de programación en Python, se genera el archivo scripts/d.py que contiene los parámetros de búsqueda del producto de interés.

Se establecen las coordenadas de la región de interés (-58° 48’ 48
S, 27° 29’ 18
O), la fecha (2.1.2) y el nivel de procesamiento.

2.1.4 producto_zip

Se ejecuta el script Python que descarga el producto. Utiliza las credenciales de mi cuenta en Copernicus Data Space Ecosystem. El nivel de procesamiento es L2A, en reflectancia de superficie, con corrección atmosférica automática.

El producto a descargar corresponde al SAFE y se encuentra comprimido en un archivo .zip. El tamaño del producto es 1Gb aproximadamente.

2.1.5 recorte_tif

Extracción del contenido del .zip y creación de un stack a partir de las bandas de interés.

El stack contiene las bandas espectrales: B01, B02, B03, B04, B05, B06, B07, B08, B8A, B11 y B12. Se recorta al polígono vector/recorte_puente.gpkg y luego se hace un remuestreo a 10 m. Las características de estas bandas se detallan en la tabla 1.

Se almacena el recorte .tif, siendo el nombre del archivo la fecha de adquisición del producto.

2.1.6 datos_gis

A partir de la fecha (2.1.2), se genera un vector con las coordenadas geográficas del Excel (2.1.1). Luego, se extraen los valores de píxeles por cada banda. Se actualiza el archivo datos/base_de_datos_gis.csv (2.2.1) con los nuevos datos espectrales.

Las características de las bandas espectrales se muestran a continuación:

Tabla 1: Propiedades de las bandas S2-MSI.
Banda

Resolución
espacial (m)
Sentinel-2A Sentinel-2B
Longitud de
onda (nm)
Ancho de
banda (nm)
Longitud de
onda (nm)
Ancho de
banda (nm)
B01 60 442,7 20 442,3 20
B02 10 492,7 65 492,3 65
B03 10 559,8 35 558,9 35
B04 10 664,6 30 664,9 31
B05 20 704,1 14 703,8 15
B06 20 740,5 14 739,1 13
B07 20 782,8 19 779,7 19
B08 10 832,8 105 832,9 104
B8A 20 864,7 21 864 21
B09 60 945,1 19 943,2 20
B10 60 1373,5 29 1376,9 29
B11 20 1613,7 90 1610,4 94
B12 20 2202,4 174 2185,7 184

2.1.7 datos_lab

Los datos fisicoquímicos del Excel se extraen a partir de la fecha y se combinan con los datos ya presentes en el archivo datos/base_de_datos_lab.csv.

2.2 Datos

Los datos generados son del tipo archivo de texto (.csv) y ráster (.tif).

2.2.1 Bases de datos

La ejecución de targets tiene como propósito (1) la obtención de los datos espectrales y fisicoquímicos de los sitios de muestreo sobre el río Paraná.

  • Datos espectrales, datos/base_de_datos_gis.csv

El archivo de texto posee los valores de reflectancia de superficie (entre \(0 - 1\)) para cada banda de S2-MSI. Se generan dos valores para cada sitio: 1x1, que consiste en el valor exacto del píxel; y 3x3, que toma la media de una ventana de píxeles alrededor del píxel central.

Se incluye la fecha, el número de sitio y las coordenadas geográficas en el sistema EPSG:4326, en latitud y longitud.

  • Datos fisicoquímicos, datos/base_de_datos_lab.csv

Sobre el curso de agua se obtienen pH, conductividad, profundidad de disco de Secchi y las coordenadas geográficas. En laboratorio se miden turbidez por dos métodos: colorimétrico (HACH) y turbidímetro (Hazemeter), y sólidos suspendidos por gravimetría.

2.2.2 Recortes ráster

Los productos S2-MSI son recortados a la región de interés, alrededor del Puente Chaco-Corrientes.

Se genera un stack con las bandas de interés (2.1.6) y se almacena con el nombre de la fecha correspondiente en la carpeta recorte/ con formato .tif.

2.3 Creación de objetivos

Para generar nuevos objetivos, hay que editar el archivo _targets.R agregando un nuevo elemento a list():

targets::tar_target(
  names = nombre_de_objetivo,
  command = funcion()
)

La funcion() se desarrolla en el archivo scripts/funciones.R. En caso de hacer el seguimiento de archivos agregar el argumento format = "file".

2.4 Entorno de ejecución

Definir las versiones de los paquetes utilizados en el presente proyecto es relevante ya que permite asegurar la reproducibilidad de los resultados. Para tal fin se emplea el paquete renv.

La instalación de paquetes se realiza de manera tradicional con install.packages("nombre_de_paquete"). Cada vez que se instale, actualice o remueva un nuevo paquete ejecutar en la consola:

renv::snapshot()

Esto actualiza el archivo renv.lock con la información de cada paquete. Para verificar el estado actual de renv, correr:

renv::status()

2.5 Quarto

El presente sitio web fue desarrollado con la herramienta Quarto. Para generar el sitio web se debe renderizar el archivo index.qmd que produce index.html.

La publicación se lleva a cabo en Quarto Pub. Los datos de publicación se registran en el archivo _publish.yml.

Para regenerar el .html e inmediatamente publicar el sitio web, correr en la terminal:

quarto publish

En la terminal se debe elegir la cuenta asociada a Quarto Pub.

3 Muestreos

Los muestreos, según lo permita la logística, se llevan a cabo cada fecha de adquisición de S2-MSI, cada 5 días sobre la región de interés, con cielo despejado. El plan de adquisición actualizado puede descargarse en formato .kml.

En cada fecha se toman 8 muestras de agua sobre una transecta a lo largo del río Paraná. Los sitios son aproximadamente equidistantes entre sí y con las orillas.

La fecha actual y los siguientes 10 muestreos son:

Tabla 2: Fecha actual y próximos 10 muestreos
Fecha Día
2024-06-14 Viernes
2024-06-14 Viernes
2024-06-19 Miércoles
2024-06-24 Lunes
2024-07-04 Jueves
2024-07-09 Martes
2024-07-19 Viernes
2024-07-24 Miércoles
2024-07-29 Lunes
2024-08-08 Jueves
2024-08-13 Martes

Las muestras de agua se toman en botellas de vidrio color caramelo de 1 litro y se registra la posición geográfica del sitio.

Sobre el agua se miden pH, conductividad y profundidad de disco de Secchi. Luego, en el laboratorio se miden turbidez y sólidos suspendidos. A continuación, se describen cada uno:

  • pH y conductividad (μS/cm), a partir de un equipo multiparamétrico.

  • Profundidad de disco de Secchi (cm).

  • Sólidos suspendidos (ppm) por método gravimétrico, utilizando el método estandarizado 2540 D, que emplea filtros de 47 mm de diámetro y 0,5 μm de poro.

  • Turbidez se obtiene a partir de dos métodos:

    • Colorimétrico (NTU), utilizando el equipo HACH, programa 95.
    • Turbidímetro (EBC), que emplea el Hazemeter.

La relación entre las unidades de turbidez es: \(1~NTU = 0,25~EBC\).

4 Resultados

Se muestran las correlaciones lineales entre los parámetros espectrales y fisicoquímicos. De estos últimos se incluye la serie temporal según el sitio de muestreo.

Las firmas espectrales se encuentran en la siguiente sección (5).

4.1 Datos fisicoquímicos

Tabla de coeficientes de correlación lineal R (Pearson) entre pares de parámetros fisicoquímicos, y los valores se acomodan como una matriz triangular para evitar repeticiones.

Tabla 3: Correlación LAB
pH Cond
(μS/cm)
Sól. susp.
(ppm)
Turb
(NTU)

Cond
(μS/cm)

-0,289

Sól. susp.
(ppm)

-0,216

0,963✦

Turb
(NTU)

-0,113

0,843✦

0,829✦

SDD
(cm)

-0,173

-0,408✦

-0,635✦

-0,697✦

✦ : |R| > 0,5
R : p-valor < 0,05

Las correlaciones mostradas en la tabla anterior (3) pueden visualizarse en las siguientes figuras. La línea punteada corresponde al mejor ajuste lineal para cada par de parámetros.

Las siguientes figuras muestran la evolución de los datos fisicoquímicos por sitio muestral y fecha.

4.2 Datos espectrales

Coeficientes de correlación lineal de Pearson entre reflectancias de superficie de las bandas espectrales (tabla 1) de S2-MSI.

Tabla 4: Correlación GIS
B01 B02 B03 B04 B05 B06 B07 B08 B8A B11

B02

0,952✦

B03

0,830✦

0,937✦

B04

0,520✦

0,652✦

0,833✦

B05

0,475✦

0,583✦

0,747✦

0,980✦

B06

0,664✦

0,729✦

0,803✦

0,916✦

0,948✦

B07

0,665✦

0,720✦

0,784✦

0,900✦

0,940✦

0,998✦

B08

0,663✦

0,722✦

0,780✦

0,892✦

0,931✦

0,995✦

0,997✦

B8A

0,842✦

0,877✦

0,883✦

0,831✦

0,837✦

0,956✦

0,955✦

0,953✦

B11

0,955✦

0,945✦

0,867✦

0,535✦

0,466✦

0,644✦

0,635✦

0,632✦

0,831✦

B12

0,951✦

0,940✦

0,863✦

0,532✦

0,462✦

0,638✦

0,630✦

0,627✦

0,826✦

0,999✦

✦ : |R| > 0,5
R : p-valor < 0,05

4.3 Sitios muestrales

Se muestran los sitios de muestreo para todas las fechas disponibles junto con la imagen en composición de color real correspondiente.


Actualmente se realizaron 4 muestreos, en los que se recolectaron 32 muestras de agua.

En todos los casos, no se aprecia presencia de nubes sobre los puntos de toma de muestras.

Los ocho sitios muestrales se nombran correlativamente de P1 a P8, iniciando en la provincia del Chaco con y finalizando en la provincia de Corrientes.

5 Firmas espectrales

A partir de los valores de píxel de las reflectancias de superficie (2.2.1) se construyen firmas espectrales, que permiten inferir las características del agua. Las firmas espectrales a lo largo de la transecta en el río Paraná sirven para ver el cambio entre costas.

Firmas espectrales por fecha y sitio muestral a lo largo de una línea transecta.


Las curvas color azul corresponden a los sitios cercanos a la orilla chaqueña. Los puntos cercanos a la costa correntina son de color rojo.

Generalmente, las firmas espectrales del lado chaqueño presentan los mayores valores. A medida que los sitios de muestreo se acercan al lado correntino, las firmas espectrales comienzan a aplanarse.

6 Algoritmos

El desarrollo de los algoritmos para la estimación de indicadores de calidad del agua requiere la combinación de datos espectrales y fisicoquímicos.

Se proponen múltiples modelos para la estimación de parámetros. Se siguen los lineamientos de tidymodels para el entrenamiento y validación de los modelos.

Contacto

Sitio web desarrollado y mantenido por: Mgtr. Víctor Gauto .

Grupo de Investigación Sobre Temas Ambientales y Químicos (GISTAQ) , , .





14/06/2024 10:07